Le modèle d'exécution CUDA transforme votre ordinateur en un système hétérogène haute performance. Imaginez un Grand Directeur (l'Hôte/UCP) et une Armée de milliers (le Dispositif/GPU). Le Directeur gère la logique complexe et la prise de décision, tandis que l'Armée exécute des tâches massives et répétitives simultanément.
1. La division architecturale
L' Hôte est un processeur optimisé pour la latence, conçu pour les flux de contrôle complexes et les tâches séquentielles. À l'inverse, le Dispositif est un GPU optimisé pour le débit, comprenant des milliers de cœurs simples conçus pour exécuter la même instruction sur de vastes jeux de données simultanément.
2. Le rythme d'exécution
Un programme CUDA fonctionne comme une série de phases. L'exécution commence sur l'Hôte pour le "code séquentiel." Lorsque le programme atteint un "noyau parallèle," il lance une Grille de fils sur le Dispositif. Le contrôle revient à l'Hôte une fois que le Dispositif a terminé sa charge de travail massive.
3. Spécialisation des performances
Le modèle exploite les forces des deux : l'UCP gère les ressources système et les branches complexes, tandis que le GPU exécute SPMD (Programme unique, multiples données) la logique pour traiter les éléments de données en parallèle.